智能论文笔记

Artificial Neural Networks for Finger Vein Recognition: A Survey

Yimin Yin , Renye Zhang , Pengfei Liu , Wanxia Deng , Siliang He , Chen Li , Jinghua Zhang

分类：计算机视觉

2022-08-29

手指静脉识别是一种新兴的生物识别识别技术。与人体表面上的其他生物特征不同，手指的静脉血管组织被埋在皮肤深处。由于这种优势，手指静脉识别是高度稳定和私人的。它们几乎不可能被外部条件偷走且难以干预。与基于传统机器学习的手指静脉识别方法不同，人工神经网络技术，尤其是深度学习，它不依赖功能工程并具有出色的性能。为了总结基于人工神经网络的手指静脉识别的发展，本文收集了149篇相关论文。首先，我们介绍了手指静脉识别的背景和这项调查的动机。然后，引入了人工神经网络的发展历史和手指静脉识别任务上的代表网络。然后描述在手指静脉识别中广泛使用的公共数据集。之后，我们分别基于经典神经网络和深层神经网络总结了相关的手指静脉识别任务。最后，讨论了手指静脉识别的挑战和潜在发展方向。据我们所知，本文是第一次综合调查，重点是基于人工神经网络的指静脉识别。

translated by 谷歌翻译

Deep Learning for Finger Vein Recognition: A Brief Survey of Recent Trend

Renye Zhang , Yimin Yin , Wanxia Deng , Chen Li , Jinghua Zhang

分类：计算机视觉 | 人工智能

2022-07-05

Finger静脉图像识别技术在生物识别识别中起着重要作用，并已成功应用于许多领域。由于静脉被埋在皮肤组织下方，因此手指静脉图像识别具有无与伦比的优势，因此不容易被外部因素打扰。这篇综述总结了有关手指静脉图像识别的46篇论文，从2017年到2021年。这些论文根据深神经网络的任务进行了汇总。此外，我们提出了手指静脉图像识别的挑战和潜在发展方向。

translated by 谷歌翻译

Video Shadow Detection via Spatio-Temporal Interpolation Consistency Training

Xiao Lu , Yihong Cao , Sheng Liu , Chengjiang Long , Zipei Chen , Xuanyu Zhou , Yimin Yang , Chunxia Xiao

分类：计算机视觉

2022-06-17

注释大规模数据集以进行监督的视频阴影检测方法是一项挑战。直接使用在标记的图像上训练的模型直接导致高概括错误和时间不一致的结果。在本文中，我们通过提出一个时空插值一致性训练（Stict）框架来解决这些挑战，以合理地将未标记的视频框架以及标记的图像以及图像阴影检测网络训练中进行合理地馈送。具体而言，我们提出了空间和时间ICT，其中定义了两个新的插值方案，\ textit {i.e。}，空间插值和时间插值。然后，我们相应地得出了相应的空间和时间插值一致性约束，以增强像素智能分类任务中的概括和分别鼓励时间一致的预测。此外，我们设计了一个量表感知网络，用于图像中的多尺度阴影知识学习，并提出了比例一致性约束，以最大程度地减少不同尺度上预测之间的差异。我们提出的方法在VISHA数据集和自称数据集上得到了广泛的验证。实验结果表明，即使没有视频标签，我们的方法也比大多数最新的监督，半监督或无监督的图像/视频阴影检测方法以及相关任务中的其他方法更好。代码和数据集可在\ url {https://github.com/yihong-97/stict}上获得。

translated by 谷歌翻译

Projected Sliced Wasserstein Autoencoder-based Hyperspectral Images Anomaly Detection

Yurong Chen , Hui Zhang , Yaonan Wang , Q. M. Jonathan Wu , Yimin Yang

分类：计算机视觉

2021-12-20

异常检测是指识别偏离正常模式的观察，这是各个领域的活跃研究区域。最近，数据量表越来越多，复杂性和维度将传统的表示和基于统计的异常检测方法变得具有挑战性。在本文中，我们利用了高光谱图像异常检测的生成模型。 GIST是模拟正常数据的分布，而分布外样品可以被视为异常值。首先，研究了基于变分的基于异常的检测方法。理论上和经验地发现它们由于距离强烈的概念（$ F $ -divergence）作为正则化而不稳定。其次，本文介绍了切片的Wasserstein距离，与F分歧相比，这是一种较弱的分布措施。然而，随机切片的数量难以估计真正的距离。最后，我们提出了一个投影的切片Wasserstein（PSW）基于AutoEncoder的异常筛选方法。特别是，我们利用计算友好的特征分解方法来找到切片高维数据的主成分。此外，我们所提出的距离可以用闭合形式计算，即使是先前的分布也不是高斯。在各种现实世界高光谱异常检测基准上进行的综合实验证明了我们提出的方法的卓越性能。

translated by 谷歌翻译

Uncertainty Estimation via Response Scaling for Pseudo-mask Noise Mitigation in Weakly-supervised Semantic Segmentation

Yi Li , Yiqun Duan , Zhanghui Kuang , Yimin Chen , Wayne Zhang , Xiaomeng Li

分类：计算机视觉

2021-12-14

无弱监督的语义细分（WSSS）段对象没有密度注释的沉重负担。虽然作为价格，产生的伪掩模存在明显的嘈杂像素，其导致在这些伪掩模上训练的次优分割模型。但是罕见的研究通知或解决这个问题，即使在他们改进伪掩码后，即使这些嘈杂的像素也是不可避免的。所以我们试图在噪音缓解的方面提高WSSS。并且我们观察到许多嘈杂的像素具有高置信度，特别是当响应范围太宽或狭窄时，呈现不确定的状态。因此，在本文中，我们通过多次缩放预测映射来模拟响应的噪声变化以进行不确定性估计。然后使用不确定性来重量分割损失以减轻嘈杂的监督信号。我们调用此方法URN，通过响应缩放来缩短来自不确定性估计来噪声缓解。实验验证了URN的好处，我们的方法分别在Pascal VOC 2012和MS Coco 2014上实现了最先进的71.2％和41.5％，而无需额外的型号，如显着性检测。代码可在https://github.com/xmed-lab/urn获得。

translated by 谷歌翻译

GCNs-Net: A Graph Convolutional Neural Network Approach for Decoding Time-resolved EEG Motor Imagery Signals

Yimin Hou , Shuyue Jia , Xiangmin Lun , Shu Zhang , Tao Chen , Fang Wang , Jinglei Lv

分类：机器学习 | 神经与进化计算

2020-06-16

为了开发有效和高效的脑电器界面（BCI）系统，非常需要精确地解码脑电图（EEG）测量的大脑活动。传统作品在不考虑电极之间的拓扑关系的情况下分类EEG信号。然而，神经科学研究越来越强调了脑动力学的网络模式。因此，电极的欧几里德结构可能无法充分反映信号之间的相互作用。为了填补差距，提出了一种基于图形卷积神经网络（GCNS）的新型深度学习框架，以增强在不同类型的电动机图像（MI）任务期间的原始EEG信号的解码性能，同时与电极的功能拓扑关系协作。基于绝对Pearson的总体信号矩阵，建立了EEG电极的图拉普拉斯。由图形卷积层构建的GCNS-NET学会了广义特征。遵循的汇集层减少了维度，并且完全连接的软墨幅层衍射最终预测。已介绍的方法已被证明可以为个性化和群体的预测汇聚。与现有研究相比，它分别在受试者和组级别实现了最高平均准确度，93.056％和88.57％（物理仪数据集），96.24％和80.89％（高伽玛数据集），这表明个人适应性和鲁棒性变化性。此外，在交叉验证的重复实验中，性能稳定地再现。为了得出结论，基于功能拓扑关系的GCNS-Net滤波器EEG信号，该关系管理用于解码脑电机图像的相关特征。

translated by 谷歌翻译

Deep Feature Mining via Attention-based BiLSTM-GCN for Human Motor Imagery Recognition

Yimin Hou , Shuyue Jia , Xiangmin Lun , Shu Zhang , Tao Chen , Fang Wang , Jinglei Lv

分类：计算机视觉 | 机器学习

2020-05-02

识别准确性和响应时间既批判性均在建筑实际脑电图（EEG）的脑电电脑界面（BCI）领先期。然而，最近的方法在分类准确度或响应时间内损害。本文提出了一种新颖的深度学习方法，旨在基于头皮EEG的显着准确和敏感的电动机图像（MI）识别。双向长期内存（BILSTM），带有注意机制管理，从原始EEG信号中导出相关特征。连接的图形卷积神经网络（GCN）通过与来自整体数据的拓扑结构协作来促进解码性能。 0.4-第二检测框架显着基于个体和群体培训的有效和有效的预测，分别具有98.81％和94.64％的准确性，这取得了卓越的所有最先进的研究。引入的深度特征挖掘方法可以精确地识别来自原始EEG信号的人类运动意图，该信号铺设了将基于EEG的MI识别转换为实用BCI系统。

translated by 谷歌翻译

Real-World Image Super Resolution via Unsupervised Bi-directional Cycle Domain Transfer Learning based Generative Adversarial Network

Xiang Wang , Yimin Yang , Zhichang Guo , Zhili Zhou , Yu Liu , Qixiang Pang , Shan Du

分类：计算机视觉 | 机器学习

2022-11-19

Deep Convolutional Neural Networks (DCNNs) have exhibited impressive performance on image super-resolution tasks. However, these deep learning-based super-resolution methods perform poorly in real-world super-resolution tasks, where the paired high-resolution and low-resolution images are unavailable and the low-resolution images are degraded by complicated and unknown kernels. To break these limitations, we propose the Unsupervised Bi-directional Cycle Domain Transfer Learning-based Generative Adversarial Network (UBCDTL-GAN), which consists of an Unsupervised Bi-directional Cycle Domain Transfer Network (UBCDTN) and the Semantic Encoder guided Super Resolution Network (SESRN). First, the UBCDTN is able to produce an approximated real-like LR image through transferring the LR image from an artificially degraded domain to the real-world LR image domain. Second, the SESRN has the ability to super-resolve the approximated real-like LR image to a photo-realistic HR image. Extensive experiments on unpaired real-world image benchmark datasets demonstrate that the proposed method achieves superior performance compared to state-of-the-art methods.

translated by 谷歌翻译

Semantic Encoder Guided Generative Adversarial Face Ultra-Resolution Network

Xiang Wang , Yimin Yang , Qixiang Pang , Xiao Lu , Yu Liu , Shan Du

分类：计算机视觉 | 机器学习

2022-11-18

Face super-resolution is a domain-specific image super-resolution, which aims to generate High-Resolution (HR) face images from their Low-Resolution (LR) counterparts. In this paper, we propose a novel face super-resolution method, namely Semantic Encoder guided Generative Adversarial Face Ultra-Resolution Network (SEGA-FURN) to ultra-resolve an unaligned tiny LR face image to its HR counterpart with multiple ultra-upscaling factors (e.g., 4x and 8x). The proposed network is composed of a novel semantic encoder that has the ability to capture the embedded semantics to guide adversarial learning and a novel generator that uses a hierarchical architecture named Residual in Internal Dense Block (RIDB). Moreover, we propose a joint discriminator which discriminates both image data and embedded semantics. The joint discriminator learns the joint probability distribution of the image space and latent space. We also use a Relativistic average Least Squares loss (RaLS) as the adversarial loss to alleviate the gradient vanishing problem and enhance the stability of the training procedure. Extensive experiments on large face datasets have proved that the proposed method can achieve superior super-resolution results and significantly outperform other state-of-the-art methods in both qualitative and quantitative comparisons.

translated by 谷歌翻译

Unsupervised Industrial Anomaly Detection via Pattern Generative and Contrastive Networks

Jianfeng Huang , Chenyang Li , Yimin Lin , Shiguo Lian

分类：计算机视觉 | 人工智能

2022-07-20

很难收集足够的缺陷图像来训练工业生产中的深度学习网络。因此，现有的工业异常检测方法更喜欢使用基于CNN的无监督检测和本地化网络来实现此任务。但是，由于传统的端到端网络在高维空间中符合非线性模型的障碍，因此这些方法总是失败。此外，它们通过将正常图像的特征群群群群群群集成，这基本上是导致纹理变化不健壮的。为此，我们提出了基于视觉变压器的（基于VIT）的无监督异常检测网络。它利用层次任务学习和人类经验来增强其解释性。我们的网络包括模式生成和比较网络。模式生成网络使用两个基于VIT的编码器模块来提取两个连续图像贴片的功能，然后使用基于VIT的解码器模块来学习这些功能的人类设计样式并预测第三张图像贴片。之后，我们使用基于暹罗的网络来计算“生成图像补丁”和“原始图像补丁”的相似性。最后，我们通过双向推理策略来完善异常定位。公共数据集MVTEC数据集的比较实验显示我们的方法达到了99.8％的AUC，它超过了先前的最新方法。此外，我们在自己的皮革和布数据集上给出了定性插图。准确的片段结果强烈证明了我们方法在异常检测中的准确性。

translated by 谷歌翻译